近年来,足球事件数据的主要缺点之一是广泛用于分析,它仍然需要手动收集,因此将其可用性限制在减少的比赛中。在这项工作中,我们提出了一种确定性决策基于决策的算法,以使用跟踪数据自动提取足球事件,该数据包括两个步骤:(1)一个拥有步骤,该步骤评估哪个玩家在跟踪中的每个帧中都拥有球,数据以及在球没有发挥作用的时间间隔内的不同播放器配置来告知固定片段的检测; (2)结合了第一步中计算出的球拥有的变化与足球定律,以确定游戏中的事件并设定作品。自动生成的事件针对手动注释的事件进行了基准测试,我们表明,在大多数事件类别中,所提出的方法可以在不同的比赛和跟踪数据提供商中实现$+90 \%$检测率。最后,我们演示了如何利用跟踪数据提供的上下文信息来增加自动检测事件的粒度,并展示如何使用所提出的框架在足球中进行无数的数据分析。
translated by 谷歌翻译
We introduce a machine-learning (ML)-based weather simulator--called "GraphCast"--which outperforms the most accurate deterministic operational medium-range weather forecasting system in the world, as well as all previous ML baselines. GraphCast is an autoregressive model, based on graph neural networks and a novel high-resolution multi-scale mesh representation, which we trained on historical weather data from the European Centre for Medium-Range Weather Forecasts (ECMWF)'s ERA5 reanalysis archive. It can make 10-day forecasts, at 6-hour time intervals, of five surface variables and six atmospheric variables, each at 37 vertical pressure levels, on a 0.25-degree latitude-longitude grid, which corresponds to roughly 25 x 25 kilometer resolution at the equator. Our results show GraphCast is more accurate than ECMWF's deterministic operational forecasting system, HRES, on 90.0% of the 2760 variable and lead time combinations we evaluated. GraphCast also outperforms the most accurate previous ML-based weather forecasting model on 99.2% of the 252 targets it reported. GraphCast can generate a 10-day forecast (35 gigabytes of data) in under 60 seconds on Cloud TPU v4 hardware. Unlike traditional forecasting methods, ML-based forecasting scales well with data: by training on bigger, higher quality, and more recent data, the skill of the forecasts can improve. Together these results represent a key step forward in complementing and improving weather modeling with ML, open new opportunities for fast, accurate forecasting, and help realize the promise of ML-based simulation in the physical sciences.
translated by 谷歌翻译
机器学习的进展(ML)源于数据可用性,计算资源的组合,以及对电感偏差的适当编码。有用的偏差经常利用预测问题的对称性,例如依赖于翻译设备的卷积网络。自动发现这些有用的对称具有大大提高ML系统性能的可能性,但仍然是一个挑战。在这项工作中,我们专注于连续的预测问题,并采取灵感来自Noether定理,以减少发现归纳偏差到Meta学习的有用保守数量的问题。我们提出了挪威网络:在预测函数内优化了Meta学习保存损失的新型架构。我们在理论和实验上示出了Noether网络提高了预测质量,提供了一种用于在顺序问题中发现感应偏差的一般框架。
translated by 谷歌翻译
AI解释性提高了模型的透明度,使它们更值得信赖。这种目标是由于深受深层学习模型的出现而闻名,这是模糊的;即使在图像的域名中,深度学习最多,解释性仍然很差。在图像识别领域,已经提出了许多特征归因方法,其目的是解释使用视觉提示的模型的行为。但是,到目前为止没有建立指标以客观地评估和选择这些方法。在本文中,我们提出了一致的特征归因方法的评估度量 - 焦点 - 旨在量化其对任务的一致性。虽然最先前的工作为样本增加了分配噪声,但我们介绍了一种方法来增加分布中的噪声。这是通过来自不同类别的实例的马赛克来完成的,并且这些解释这些生成。在那些时,我们计算视觉伪精度度量,焦点。首先,我们通过一系列随机化实验表明了这种方法的鲁棒性。然后我们使用焦点来比较遍布几个CNN架构和分类数据集的六种流行的解释性技术。我们的结果发现一些方法可以持续可靠(LRP,GradCam),而其他方法会产生类别无关的解释(Smoothgrad,Ig)。最后,我们介绍了另一个焦点的应用,使用它来识别和表征模型中的偏差。这使得偏见管理工具,在另一个小步迈向值得信赖的AI。
translated by 谷歌翻译